<html lang="fr"><head><meta content="text/html; charset=utf-8" http-equiv="Content-Type"> <link rel="stylesheet" href="http://www.google.com/google.css"> <link rel="stylesheet" href="../leftnav.css"> <style>
<!--
body,td,font,p,a{font-family:arial,sans-serif}
.i { margin-left: 1em; margin-right: 2em; }
//.style1 {font-weight: bold}
.style1 {font-weight: bold}
.d {color:#999999;text-decoration:italics;font-size:10px;}
.changes {color: #FF0000}
-->
</style> <script src=" https://ssl.google-analytics.com/urchin.js " type="text/javascript">
</script> <script type="text/javascript">
  _uacct="UA-18009-2";
  _utcp="/webmasters/sitemaps/";
  _uanchor=1; 
  urchinTracker();
</script>  <title>Outils Google pour les webmasters</title> </head> <body class="search" bgcolor="#ffffff" text="#000000" link="#0000CC" vlink="#800080" alink="#ff0000" topmargin="3"> <table width="95%" border="0" cellpadding="0" cellspacing="2">  <tr valign="top">  <td width="1%"><a href="https://www.google.com/webmasters/sitemaps/"> <img src="http://www.google.com/images/google_sm.gif" hspace="15" height="59" width="143" vspace="5" alt="Retour à la page d'accueil de Google." border="0"></a></td>  <td width="100%" valign="middle">  <table width="100%" border="0" cellspacing="0" cellpadding="0">  <tr>  <td><font size="+0"><b>Outils pour les webmasters</b></font></td>  </tr>  <tr>  <td style="border-bottom:1px solid #999999" height="1"><img width="1" height="1" alt=""></td>  </tr>  </table>  </td>  </tr> </table> <table border="0" cellpadding="2" cellspacing="0" width="95%">  <tr>  <td width="175" valign="top">  <font size="-1">  <p class="sidenavlink"><a href="about.html">À propos des outils pour les webmasters</a></p>  <p class="sidenavlink"><a href="protocol.html">Utilisation du protocole Sitemap</a></span><p class="sidenavtoc">Utilisation du Générateur Sitemap</p> <p class="sidenavlink"><a href="http://www.google.com/webmasters/">Centre Google pour les webmasters</a></p>  </font></td>  <td background="http://www.google.com/images/dot2.gif" valign="bottom" width="5"><img src="http://www.google.com/images/dot2.gif" width="1" height="1"></td>  <td style="background-color: #ffffff" width="10" valign="top"><img src="http://www.google.com/images/cleardot.gif" width="10" height="1"></td>  <td>  <div class="content">   <p><strong>Sommaire</strong></p>  <p><font size="-1"><a href="#before">Avant de commencer</a><br><a href="#download">Téléchargement des fichiers de programme du Générateur Sitemap</a><br><a href="#config">Création d'un fichier de configuration</a><br><a href="#copy">Transfert des fichiers sur votre serveur Web</a><br><a href="#execute">Exécution du script du Générateur Sitemap</a><br><a href="#submitting">Envoi de votre plan Sitemap à Google</a><br><a href="#troubleshoot">Résolution des problèmes</a> </font></p>  <table border="0" cellpadding="2" cellspacing="0" width="100%">  <tbody><tr>  <td style="border-top: 1px solid rgb(221, 173, 8); background-color: rgb(254, 250, 222);"><a name="before"></a><b>Avant de commencer</b></td>  </tr>  </tbody></table>  <p><font size="-1">Le Générateur Sitemap de Google est un script Python qui crée un plan Sitemap de votre site à l'aide du protocole Sitemap. Ce script est capable de créer des plans Sitemap à partir de listes d'URL, de répertoires de serveurs Web ou de fichiers journaux. Pour utiliser ce script : </font></p>   <ul>  <li><font size="-1">Vous devez être en mesure de vous connecter à votre serveur Web et d'y exécuter des scripts. </font></li>  <li><font size="-1">Le logiciel Python version 2.2 ou ultérieure doit être installé sur votre serveur Web. </font></li>  <li><font size="-1">Vous devez connaître la commande permettant d'exécuter Python. Il s'agit généralement de <strong>python</strong>, mais cela peut varier d'une installation à une autre. Par exemple, si deux versions de Python sont installées concurremment sur le serveur Web, il est possible que la version la plus ancienne soit exécutée à l'aide de la commande <strong>python</strong>, et la plus récente à l'aide de la commande <strong>python2</strong>. </font></li>  <li><font size="-1">Vous devez connaître le chemin de répertoires permettant d'accéder à votre site. Si votre serveur Web n'héberge qu'un site, ce chemin peut se présenter ainsi : <strong>var/www/html</strong>. Si vous disposez d'un serveur virtuel hébergeant plusieurs sites, le chemin peut se présenter ainsi : <strong>home/virtual/site1/fst/var/www/html</strong>. </font></li>  <li><font size="-1">Vous devez être en mesure de transférer des fichiers sur votre serveur Web (en utilisant le protocole FTP, par exemple). </font></li>  <li><font size="-1">Si vous envisagez de générer une liste d'URL à partir des fichiers journaux, vous devez connaître le codage utilisé pour ces journaux ainsi que le chemin complet permettant d'y accéder. </font></li>  </ul>   <p><font size="-1">Si vous avez des doutes sur ces points, vous pouvez vérifier auprès de votre société d'hébergement Web. </font></p>  <font size="-1">  <p>Vous êtes prêt à commencer. Voici un aperçu de ce que vous devrez faire.</p>  </font>  <font size="-1">  <ol>  <li><font size="-1"><a href="#download">Téléchargez</a> les fichiers de programme du Générateur Sitemap. Copiez ces fichiers dans un répertoire local. </font></li>  <li><font size="-1"><a href="#config">Créez un fichier de configuration</a> pour votre site en utilisant comme modèle le fichier <strong>example_config.xml</strong> fourni. Modifiez le fichier d'exemple de façon à l'adapter à votre site, puis enregistrez-le. </font></li>  <li><font size="-1"><a href="#copy">Transférez les fichiers nécessaires</a> sur votre serveur Web. </font></li>  <li><font size="-1"><a href="#execute">Exécutez</a> <strong>sitemap_gen.py</strong>. </font></li>  <li><font size="-1"><a href="http://www.google.com/support/webmasters/bin/answer.py?answer=34575&topic=8496">Ajoutez</a> le plan Sitemap généré à votre compte Google Outils pour les webmasters. </font></li>  <li><font size="-1"><a href="#recur">Configuration d'un script répétitif</a>. (facultatif) </font></li>  </ol>  </font>   <p><font size="-1">Si vous ne parvenez pas à utiliser le Générateur Sitemap, vous pouvez ajouter un plan Sitemap à votre compte d'outils Google pour les webmasters dans un <a href="http://www.google.com/support/webmasters/bin/answer.py?answer=34606&topic=8516">autre format</a>, sous forme de fichier texte par exemple. Pour obtenir des liens vers des programmes tiers compatibles avec Google Sitemaps, <a href="http://code.google.com/sm_thirdparty.html">cliquez ici</a>.</font></p>  <table border="0" cellpadding="2" cellspacing="0" width="100%">  <tbody><tr>  <td style="border-top: 1px solid rgb(221, 173, 8); background-color: rgb(254, 250, 222);"><a name="download"></a><b>1. Téléchargement des fichiers de programme du Générateur Sitemap</b></td>  </tr>  </tbody></table>  <font size="-1">  <p>Les fichiers du Générateur Sitemap sont disponibles sous forme d'archives ZIP et GZ <font size="-1">à l'emplacement suivant :</font></p>  </font>  <p><font size="-1"><a href="http://www.sourceforge.net/project/showfiles.php?group_id=137793&amp;package_id=153422">http://sourceforge.net/project/showfiles.php?group_id=137793&amp;package_id=153422</a></font></p>  <font size="-1">  <p>Une fois les archives transférées, extrayez-les dans un répertoire local. Recherchez les fichiers suivants :</p>  <ul>  <li><strong>README</strong> – contient les informations les plus récentes sur cet outil</li>  <li><strong> sitemap_gen.py</strong> – script Python qui génère votre plan Sitemap</li>  <li><strong> example_config.xml</strong> – modèle de fichier de configuration que vous utiliserez pour définir la configuration de votre site.</li>  <li><strong> example_urllist.txt</strong> – liste d'exemples d'URL à utiliser pour créer un plan Sitemap comprenant les URL que vous présentez.</li>  </ul>  </font>  <table border="0" cellpadding="2" cellspacing="0" width="100%">  <tbody><tr>  <td style="border-top: 1px solid rgb(221, 173, 8); background-color: rgb(254, 250, 222);"><a name="config"></a><b>2a. Création d'un fichier de configuration</b></td>  </tr>  </tbody></table>  <font size="-1">  </font><p><font size="-1">Cette section décrit en détail la procédure de création d'un fichier de configuration. En outre, elle <a href="#config_reference">répertorie de façon exhaustive</a> les options proposées. Si vous créez des <a href="http://www.google.com/support/webmasters/bin/answer.py?answer=34627&topic=8493">plans Sitemap pour appareils mobiles</a>, consultez les <a href="#creating_mobile">instructions supplémentaires concernant les appareils mobiles</a>. </font></p>  <font size="-1"><p>Pour créer un fichier de configuration de votre site, vous devez disposer des informations suivantes :</p>  <ul>  <li>URL de base de votre site (par exemple <strong>http://www.example.com/</strong>). Vérifiez que vous avez inclus le protocole (par exemple <strong>http://</strong>). Ainsi, <strong>http://www.google.com</strong> est une URL de base correcte, mais <strong>www.google.com</strong> ne l'est pas.</li>   
<li>Chemin emprunté par le serveur Web pour accéder à l'emplacement où vous souhaitez stocker le plan Sitemap. Il s'agit habituellement du chemin vers l'URL de base car le plan Sitemap ne peut pas contenir d'URL pointant vers des répertoires de niveau supérieur à celui où il est placé. Lorsque vous exécutez le Générateur Sitemap, il crée le plan Sitemap et le stocke à l'emplacement que vous avez indiqué.</li>   <li>Méthodes que vous souhaitez voir utiliser par le Générateur Sitemap pour créer votre plan Sitemap. Vous pouvez les combiner selon vos besoins. Les méthodes suivantes sont disponibles :</li>  </ul>   </font><ol> <ul>  <li><font size="-1"><strong> <a href="#URL">URL</a></strong> – répertoriez les URL individuelles dans cette section du fichier de configuration, ainsi que les informations concernant chacune d'elles. Vous utiliserez généralement cette méthode afin d'inclure manuellement des URL supplémentaires que les autres méthodes n'auraient pas pris en compte. </font></li>  <li><font size="-1"><strong><a href="#urllist">Liste d'URL</a> </strong> – pointez le fichier de configuration vers un fichier texte contenant une liste d'URL. Vous utiliserez éventuellement cette méthode si ce fichier texte existe déjà ou si vous utilisez un script pour générer une liste d'URL. </font></li>  <li><font size="-1"><strong><a href="#directory">Chemins d'accès au répertoire</a></strong> – indiquent les chemins d'accès au répertoire de votre site et les URL correspondant à ces chemins. Le Générateur Sitemap créera une liste d'URL en fonction du contenu de ces répertoires. Vous pouvez utiliser cette méthode si votre site est constitué de fichiers HTML statiques. </font></li>  <li><font size="-1"><strong> Les <a href="#logs">fichiers journaux</a></strong> – pointent vers le chemin d'accès à vos fichiers journaux. Le Générateur Sitemap créera une liste d'URL correspondant aux URL répertoriées dans les fichiers journaux. Vous pouvez utiliser cette méthode si votre site est constitué de pages dynamiques. </font></li>  <li><font size="-1"><strong> <a href="#sitemap">Sitemap</a></strong> – pointe vers les plans Sitemap créés à l'aide du Générateur Sitemap. Le Générateur Sitemap crée un fichier Sitemap unique comprenant les URL répertoriées dans chaque plan Sitemap. Vous pouvez utiliser cette méthode si vous avez déjà créé des plans Sitemap plus petits que vous souhaitez rassembler dans un fichier unique, plus volumineux. </font></li>  </ul>  </ol>   <font size="-1"><p><b><a name="create_config"></a>Pour créer le fichier de configuration, procédez comme suit :</b></p>  </font>  <ol>  <font size="-1"> <li>Ouvrez le fichier <strong>example_config.xml</strong> dans un éditeur de texte. Enregistrez-le sous un nouveau nom (par exemple <strong>config.xml</strong> ou <strong>monsite_config.xml</strong>).</li>  </font>    <font size="-1">  <li>Recherchez la section relative à la définition du site :</li>  </font>   <pre>&lt;site 
base_url="http://www.example.com/" 
store_into="/var/www/docroot/sitemap.xml.gz"
verbose="1"&gt;</pre>   <font size="-1"><li>Remplacez la valeur <strong>base_url</strong> par l'URL de votre site.</li>   <li>Attribuez au paramètre <strong>store_into</strong> une valeur indiquant le chemin de l'emplacement sur votre serveur Web où vous souhaitez stocker le plan Sitemap et le nom du fichier à utiliser pour le plan Sitemap. Il s'agit généralement du chemin d'accès à l'URL de base, car Google ne peut accepter que les URL d'un niveau identique ou inférieur au répertoire contenant le plan Sitemap. Vous pouvez indiquer un chemin relatif à partir du répertoire où vous transférez le script ou un chemin complet à partir du niveau racine de votre serveur Web. Si vous transférez le script vers le répertoire de l'URL de base, vous pouvez simplement indiquer le nom de fichier.</li>  </font>  <font size="-1"></font><font size="-1"><li>Recherchez les sections traitant des méthodes de génération commençant par <span class="style1">** MODIFY</span> <span class="style1">or DELETE **</span>. Chacune de ces sections présente une méthode de génération de plan Sitemap.</li>  <li>Supprimez les sections décrivant les méthodes que vous ne mettrez pas en œuvre.</li>  <li>Pour sélectionner les méthodes à utiliser, suivez les instructions fournies ci-dessous.</li>  <p><strong> URL<a name="URL"></a></strong></p>  <p>Recherchez la section suivante :</p>  </font>  <pre>&lt;!-- ** MODIFY or DELETE ** 
"url" nodes specify individual URLs to include in the map. &lt;br&gt;

Required attributes: 
href - the URL

Optional attributes: 
lastmod - timestamp of last modification (ISO8601 format) 
changefreq - how often content at this URL is usually updated
priority - value 0.0 to 1.0 of relative importance in your site 
--&gt; 

&lt;url href="http://www.example.com/stats?q=name" /&gt; 
&lt;url 
href="http://www.example.com/stats?q=age" 
lastmod="2004-11-14T01:00:00-07:00" 
changefreq="yearly" 
priority="0.3"
/&gt;</pre>  <font size="-1">  <p>Cette section présente deux exemples : le premier présente uniquement l'attribut obligatoire et le deuxième l'attribut obligatoire ainsi que les attributs facultatifs.</p>  <p>Utilisez ce format pour chacune des URL à inclure. L'attribut <strong>changefreq</strong> donne à Google une idée globale de la fréquence d'actualisation de l'URL. Cette information permet à Google de déterminer à son tour la fréquence à laquelle la page doit être visitée. L'attribut <strong>priority</strong> indique à Google l'importance relative de cette page par rapport aux autres pages de votre site. Cet attribut n'a aucune incidence sur la manière dont Google compare votre page avec les pages d'autres sites, il permet simplement à Google d'identifier les pages de votre site que vous considérez comme les plus importantes.</p>  </font>  <p><font size="-1"><strong> Liste d'URL <a name="urllist"></a> </strong></font></p>  <font size="-1"><p>Recherchez la section suivante :</p>   </font>  <pre>&lt;!-- ** MODIFY or DELETE **
"urllist" nodes name text files with lists of URLs. 
An example file "example_urllist.txt" is provided. 

Required attributes: 
path - path to the file 

Optional attributes: 
encoding - encoding of the file if not US-ASCII 
--&gt; 
&lt;urllist path="example_urllist.txt" encoding="UTF-8" /&gt;</pre>   <p><font size="-1"> Utilisez ce format pour pointer vers l'emplacement et le nom du fichier texte contenant votre liste d'URL. Vous pouvez utiliser le fichier <strong>example_urllist.txt </strong> fourni comme modèle pour créer ce fichier texte. Vous pouvez indiquer le chemin relatif ou complet d'accès à votre serveur Web. Ainsi, si le Générateur Sitemap et le fichier <strong>urlist.txt </strong> se trouvent dans le même répertoire, vous pouvez simplement indiquer le nom du fichier <strong>.txt</strong>. Si vous avez créé un fichier texte utilisant un codage autre que UTF-8, utilisez l'attribut <strong>encoding</strong> pour préciser le codage utilisé. Si vous avez plusieurs fichiers .txt, vous pouvez utiliser des caractères génériques, par exemple :</font></p>  <pre>&lt;urllist path=&quot;example_urllist*.txt&quot; encoding=&quot;UTF-8&quot; /&gt;</pre>  <p><font size="-1">Vous pouvez préciser, pour chaque URL incluse dans le fichier texte, la date de la dernière modification, la fréquence d'actualisation et la priorité. Pour obtenir toutes les informations sur la structure de ce fichier, consultez la <a href="#urllist_reference">section traitant du fichier texte contenant la liste des URL</a>.</font></p>  <p><font size="-1"><strong> Chemins d'accès aux répertoires<a name="directory"></a> </strong></font></p>  <p><font size="-1">Recherchez la section suivante : </font></p>   <pre>&lt;!-- ** MODIFY or DELETE ** 
"directory" nodes tell the script to walk the file system and 
include all files and directories in the Sitemap.

Required attributes:
path - path to begin walking from 
url - URL equivalent of that path 

Optional attributes:
default_file - name of the index or default file for directory URLs

--&gt; 
 &lt;directory  path=&quot;/var/www/icons&quot;    url=&quot;http://www.example.com/images/&quot; /&gt;<br>&lt;directory<br>path=&quot;/var/www/docroot&quot;<br>url=&quot;http://www.example.com/&quot;<br>default_file=&quot;index.html&quot;<br>/&gt;</pre>   <p><font size="-1">Cette section présente deux exemples. Si toutes vos pages sont placées dans les sous-répertoires d'un chemin d'accès, vous n'aurez qu'une entrée à inclure. Si, en revanche, votre site offre plusieurs chemins d'accès à vos pages, vous devez inclure une entrée pour chacun d'eux. </font></p>   <p><font size="-1">Notez que chaque URL doit commencer par l'URL de base que vous avez indiquée à l'étape 3. Ainsi, les exemples contenus dans le fichier <strong>example_config.xml</strong> présentent des URL commençant par <strong>http://www.example.com/</strong>. Par conséquent, les deux URL sont correctes. </font></p>   <p><font size="-1">Remplacez les entrées de l'exemple par celles de votre site. De nombreux sites n'ont qu'une entrée qui pointe vers l'URL de base. Vérifiez que la valeur <strong>path</strong> correspond au chemin d'accès complet au répertoire existant sur votre serveur Web. Vérifiez que la valeur <strong>url</strong> est l'URL complète, avec mention du protocole (par exemple http) et une barre oblique finale, le cas échéant.</font></p>  <p><font size="-1">Vous pouvez faire appel au paramètre <strong>default_file</strong> pour indiquer le nom de fichier utilisé par votre serveur comme page par défaut d'un répertoire. Dans l'exemple qui précède, <strong>/var/www/docroot</strong> renvoie à <strong>http://www.example.com/index.html</strong>. Vous n'êtes pas tenu d'indiquer ces informations. Toutefois, si vous le faites, le Générateur Sitemap inclura une seule fois la page correspondant à chaque sous-répertoire (au lieu de mentionner l'URL du répertoire et celle du nom de fichier) et utilisera la date de la dernière modification du fichier (plutôt que sur celle du répertoire) pour extraire l'attribut lastmod de cette page. </font></p>  <p><font size="-1"><strong> Fichiers journaux <a name="logs"></a></strong></font></p>  <p><font size="-1">Recherchez la section suivante : </font></p>  <pre>&lt;!-- ** MODIFY or DELETE **
&quot;accesslog&quot; nodes tell the script to scan webserver log files to
extract URLs on your site.  Both Common Logfile Format (Apache's default 
logfile) and Extended Logfile Format (IIS's default logfile) can be read.
				
Required attributes:
 path - path to the file
Optional attributes:
 encoding - encoding of the file if not US-ASCII
  --&gt;
&lt;accesslog path=&quot;/etc/httpd/logs/access.log&quot; encoding=&quot;UTF-8&quot; /&gt;
&lt;accesslog path=&quot;/etc/httpd/logs/access.log.0&quot; encoding=&quot;UTF-8&quot; /&gt;
&lt;accesslog path=&quot;/etc/httpd/logs/access.log.1.gz&quot; encoding=&quot;UTF-8&quot; /&gt;</pre>   <p><font size="-1">Cette section présente trois exemples. Vous devez remplacer ces entrées par une entrée pour chaque fichier journal. Vérifiez que la valeur path indiquée correspond au chemin d'accès complet et au nom de fichier figurant sur votre serveur Web. Si les fichiers journaux ne sont pas codés en US-ASCII ou UTF-8, utilisez l'attribut <strong>encoding</strong> facultatif pour <a href="#encoding">indiquer</a> le système d'encodage. Vous pouvez utiliser des caractères génériques plutôt que de répertorier tous les fichiers journaux. Ainsi, dans l'exemple qui précède, vous pourriez inclure l'entrée ci-après (elle rassemblerait les trois fichiers journaux :</font></p> <pre>&lt;accesslog path=&quot;/etc/httpd/logs/access.log*&quot; encoding=&quot;UTF-8&quot; /&gt;</pre>  <p><font size="-1">Le Générateur Sitemap attribue une priorité aux URL qu'il trouve dans les fichiers journaux déterminée par la fréquence à laquelle chacune est visitée. Ainsi, une URL visitée 100 fois se verra attribuer une priorité supérieure à celle d'une URL qui n'aura été visitée que deux fois. L'attribution des priorités est relative ; elle dépend des relations entre les URL au sein du site.</font></p> <p><font size="-1"><strong> sitemap <a name="sitemap"></a></strong></font></p> <p><font size="-1">Recherchez la section suivante : </font></p>  <pre>&lt;!-- ** MODIFY or DELETE **<br>&quot;sitemap&quot; nodes tell the script to scan other Sitemap files. This can
be useful to aggregate the results of multiple runs of this script into
a single Sitemap.

Required attributes:
path - path to the file
--&gt;
&lt;sitemap path=&quot;/var/www/docroot/subpath/sitemap.xml&quot; /&gt;</pre>   <p><font size="-1">Cette section présente un exemple. Vous devez remplacer cette entrée par une entrée pour chaque plan Sitemap à inclure. Vérifiez que le chemin indiqué correspond au chemin d'accès complet et au nom de fichier figurant sur votre serveur Web. Vous pouvez également répertorier des plans Sitemap compressés avec gzip. Ils doivent alors porter l'extension .gz. Vous pouvez utiliser des caractères génériques plutôt que de répertorier tous les plans Sitemap. Ainsi, l'entrée ci-après pourrait inclure le mot &quot;sitemap&quot; et comporter une extension .xml :</font></p> <pre>&lt;sitemap path=&quot;/var/www/docroot/subpath/sitemap*.xml&quot; /&gt;</pre>  <p><font size="-1">Le Générateur Sitemap extrait les URL et les données facultatives correspondantes de chaque plan Sitemap figurant dans la liste pour créer un nouveau fichier Sitemap unique. Pour le moment, nous ne sommes pas en mesure de garantir que cette méthode s'applique aux plans Sitemap créés avec d'autres outils que le Générateur Sitemap.</font></p>     <font size="-1"><li>Recherchez la section relative à la définition du filtre :</li></font>   <pre>&lt;!-- ********************************************************         
FILTERS
				
Filters specify wild-card patterns that the script compares
against all URLs it finds. Filters can be used to exclude
certain URLs from your Sitemap, for instance if you have
hidden content that you hope the search engines don't find.

Filters can be either type=&quot;wildcard&quot;, which means standard
path wildcards (* and ?) are used to compare against URLs,
 or type=&quot;regexp&quot;, which means regular expressions are used
to compare.

Filters are applied in the order specified in this file.
An action=&quot;drop&quot; filter causes exclusion of matching URLs.
An action=&quot;pass&quot; filter causes inclusion of matching URLs,
shortcutting any other later filters that might also match.
If no filter at all matches a URL, the URL will be included.
Together you can build up fairly complex rules.

The default action is &quot;drop&quot;.
The default type is &quot;wildcard&quot;.

You can MODIFY or DELETE these entries as appropriate for
your site. However, unlike above, the example entries in
this section are not contrived and may be useful to you as
they are.
********************************************************* --&gt;

&lt;!-- Exclude URLs that end with a '~' (IE: emacs backup files) --&gt;
&lt;filter action=&quot;drop&quot; type=&quot;wildcard&quot; pattern=&quot;*~&quot; /&gt;

&lt;!-- Exclude URLs within UNIX-style hidden files or directories --&gt;
&lt;filter action=&quot;drop&quot; type=&quot;regexp&quot; pattern=&quot;/\.[^/]*&quot; /&gt;</pre>  <p><font size="-1">Vous pouvez exclure certaines URL du plan Sitemap généré en les filtrant. Vous pourrez ainsi créer une liste plus propre, limiter le nombre de référencements en double ou empêcher l'indexation de certaines URL. Notez que si vous empêchez l'indexation des URL par le biais d'un fichier <a href="http://www.robotstxt.org/wc/robots.html">robots.txt</a>, Google ne les explorera pas et ne les indexera pas, même si elles sont incluses dans votre plan Sitemap. </font></p>   <p><font size="-1"> Vous pouvez utiliser toutes les méthodes de filtrage ou certaines d'entre elles uniquement. Vous pouvez supprimer les entrées inutiles et, si nécessaire, créer des entrées supplémentaires. Vous trouverez des exemples d'utilisation ci-dessous. </font></p>  <pre>&lt;filter action=&quot;drop&quot; type=&quot;wildcard&quot; pattern=&quot;*.jpg&quot; /&gt;</pre>  <p><font size="-1">Ce filtre exclut les URL ayant une extension .jpg. Vous pouvez inclure un filtre similaire si toutes les images de votre site sont intégrées dans des pages HTML et ne doivent pas être accessibles en tant qu'URL autonomes. </font></p>  <pre>&lt;filter action=&quot;pass&quot; type=&quot;wildcard&quot; pattern=&quot;*.htm*&quot; /&gt;
&lt;filter action=&quot;drop&quot; type=&quot;wildcard&quot; pattern=&quot;*&quot; /&gt;</pre><font size="-1"> Ce filtre inclut tous les fichiers .htm* et exclut tous les autres.</font><br>  <br>    <font size="-1"></font><font size="-1"><li>Une fois que vous aurez apporté toutes les modifications nécessaires à votre site, enregistrez le fichier.</li></font>  </ol>    <font size="-1"><a name="config_reference"></a><p><b>Référence de syntaxe du fichier de configuration</b></p>  </font><font size="-1">  </font>  <p><font size="-1">Vous trouverez ci-après une description complète de la syntaxe du fichier. Chaque balise commence par un code suivi de la description des attributs. </font></p>   <p><font size="-1"><strong><a name="sitetag"></a>site<br></strong></font><font size="-1">Balise obligatoire au début de chaque fichier de configuration. </font></p>  <pre>&lt;site
base_url="http://www.example.com/"
store_into="/var/www/html/sitemap.xml.gz"
verbose="1"
supress_search_engine_notify="1"
default_encoding="UTF-8"&gt;</pre>  <br>  <font size="-1">  <table border="1" cellpadding="2" cellspacing="0" width="100%">   <tbody><tr>  <td valign="top" width="19%"><pre>base_url</pre></td>  <td valign="top" width="6%"><font size="-1">obligatoire</font></td>  <td valign="top" width="75%"><font size="-1">Chemin d'accès HTTP de base de votre site Web - seules les URL commençant par cette adresse de base peuvent être incluses dans le plan Sitemap</font></td>  </tr>   <tr>  <td valign="top"><pre>store_into</pre></td>  <td valign="top"><font size="-1">obligatoire</font></td>  <td valign="top"><font size="-1">Chemin d'accès du serveur Web au fichier de sortie recherché. Le script crée ce fichier (il est inutile de créer le fichier avant d'exécuter le script).</font></td>  </tr>   <tr>  <td valign="top"><pre>verbose</pre></td>  <td valign="top"><font size="-1">facultatif</font></td>  <td valign="top"><font size="-1">Entrez un chiffre compris entre 0 et 3, les chiffres plus élevés correspondant aux informations de débogage</font></td>  </tr>   <tr>  <td valign="top"><pre>suppress_search_engine_notify</pre></td>  <td valign="top"><font size="-1">facultatif</font></td>  <td valign="top"><font size="-1">D</font><font size="-1">ésactivez la notification au moteur de recherche en entrant « 1 » à des fins de test</font></td>  </tr>   <tr>  <td valign="top"><pre>default_encoding</pre></td>  <td valign="top"><font size="-1">facultatif</font></td>  <td valign="top"><font size="-1">Indiquez un codage de caractères à appliquer aux chemins d'accès et aux URL du système de fichiers</font></td>  </tr>   </tbody></table>  </font>  <font size="-1">   <p></p>  </font>  <p><font size="-1"><strong>url<br></strong></font><font size="-1">Balise facultative que vous pouvez utiliser pour répertorier toutes les URL de votre site. </font></p>  <p><pre>&lt;url
href="http://www.example.com/stats?q=age" 
lastmod="2004-11-14T01:00:00-07:00" 
changefreq="yearly" 
priority="0.3"
/&gt;</pre></p><table border="1" cellpadding="2" cellspacing="0" width="100%">  <tbody><tr>  <td height="20" valign="top" width="19%"><pre>href</pre></td>  <td width="6%" valign="top"><font size="-1">obligatoire</font></td>  <td valign="top" width="75%"><font size="-1">Chemin d'accès HTTP de base de votre site Web - seules les URL commençant par cette adresse de base peuvent être incluses dans le plan Sitemap</font></td>  </tr><tr>  <td valign="top"><pre>lastmod</pre></td>  <td valign="top"><font size="-1">facultatif</font></td>  <td valign="top"><font size="-1">Heure à laquelle l'URL a subi la dernière modification, au format <a href="http://www.w3.org/TR/NOTE-datetime">date et heure W3C</a> (AAAA-MM-JJhh:mm:ss+00:00). Vous pouvez omettre la partie concernant l'heure. Exemples :<br>&nbsp;&nbsp;"2005-02-21T18:00:15+00:00"<br>&nbsp;&nbsp;"2005-02-21"</font></td>  </tr><tr>  <td valign="top"><pre>changefreq</pre></td>  <td valign="top"><font size="-1">facultatif</font></td>  <td valign="top"><font size="-1">Fréquence à laquelle l'URL est susceptible de changer. Il s'agit d'une indication et non d'une obligation. La valeur doit être choisie parmi celles qui suivent : « always », « hourly », « daily », « weekly », « monthly », « yearly » ou « never ».</font></td>  </tr><tr>  <td valign="top"><pre>priority</pre></td>  <td valign="top"><font size="-1">facultatif</font></td>  <td valign="top"><font size="-1">Priorité de cette page sur d'autres pages du même site. La valeur est un nombre compris entre 0,0 et 1,0. La  valeur 0,0 correspond à la priorité la plus basse et 1,0 à la priorité la plus élevée. La priorité peut avoir une incidence sur l'ordre dans lequel les moteurs de recherche sélectionnent les URL à explorer sur votre site. En effet, cette priorité relative n'est utilisée que pour hiérarchiser les URL de votre site lors de leur sélection ; aucune comparaison ne sera établie entre la priorité de vos pages et celle des pages d'autres sites.</font></td>  </tr>  </tbody></table>  <p><font size="-1"><b>urllist<br></b></font><font size="-1">Balise facultative à utiliser pour pointer vers un fichier texte contenant la liste des URL de votre site. </font></p>  <pre>&lt;urllist path="/var/www/html/urllist.txt" encoding="UTF-8" /&gt;</pre>  <br>  <table border="1" cellpadding="2" cellspacing="0" width="100%">  <tbody><tr>  <td height="20" valign="top" width="19%"><pre>path</pre></td>  <td width="6%" valign="top"><font size="-1">obligatoire</font></td>  <td valign="top" width="75%"><font size="-1">Chemin et nom du fichier .txt. Vous pouvez indiquer un chemin complet ou relatif. </font></td>  </tr><tr>  <td valign="top"><pre>encoding</pre></td>  <td valign="top"><font size="-1">facultatif</font></td>  <td valign="top"><font size="-1">Codage du fichier (s'il est différent du système UTF-8).</font></td>  </tr>  </tbody></table> <p><font size="-1"><a name="urllist_reference"></a>Le fichier <b>urllist.txt</b> est un fichier texte simple contenant une liste d'URL à mapper. Vous pouvez également inclure des attributs facultatifs pour chaque URL. Les attributs sont entrés sur la même ligne que l'URL, séparés par un simple espace. Exemples :</font></p>  <pre>http://www.example.com/abc/something
http://www.example.com/abc/xyy.pdf lastmod=2001-12-31T14:05:06+00:00
http://www.example.com/abc/def?x=12&amp;y=23 changefreq=weekly priority=0.3</pre>  <p>  <font size="-1">   </font><table border="1" cellpadding="2" cellspacing="0" width="100%">  <tbody><tr>  <td width="19%" valign="top"><pre>lastmod</pre></td>  <td valign="top" width="6%"><font size="-1">facultatif</font></td>  <td width="75%" valign="top"><p><font size="-1">Heure à laquelle l'URL a subi la dernière modification, au format <a href="http://www.w3.org/TR/NOTE-datetime">date et heure W3C</a> (AAAA-MM-JJhh:mm:ss+00:00). Vous pouvez omettre la partie concernant l'heure. Exemples :</font><font size="-1"><br>  <br>&nbsp;&nbsp;"2005-02-21T18:00:15+00:00"<br>&nbsp;&nbsp;"2005-02-21"</font></p>  </td>  </tr><tr>  <td valign="top"><pre>changefreq</pre></td>  <td valign="top"><font size="-1">facultatif</font></td>  <td valign="top"><font size="-1"><font size="-1">Fréquence à laquelle l'URL est susceptible de changer. Il s'agit d'une indication et non d'une obligation. La valeur doit être choisie parmi celles qui suivent : « always », « hourly », « daily », « weekly », « monthly », « yearly » ou « never ».</font></font></td>  </tr><tr>  <td valign="top"><pre>priority</pre></td>  <td valign="top"><font size="-1">facultatif</font></td>  <td valign="top"><font size="-1">Priorité de cette page sur d'autres pages du même site. La valeur est un nombre compris entre 0,0 et 1,0. La  valeur 0,0 correspond à la priorité la plus basse et 1,0 à la priorité la plus élevée. La priorité peut avoir une incidence sur l'ordre dans lequel les moteurs de recherche sélectionnent les URL à explorer sur votre site. En effet, cette priorité relative n'est utilisée que pour hiérarchiser les URL de votre site lors de leur sélection ; aucune comparaison ne sera établie entre la priorité de vos pages et celle des pages d'autres sites.</font></td>  </tr>  </tbody></table>  </p>  <font size="-1">  </font>  <p><font size="-1"><strong>directory<br></strong></font><font size="-1">Balise facultative que vous pouvez utiliser pour indiquer des répertoires de votre site contenant des fichiers à partir desquels le Générateur Sitemap pourra créer une liste d'URL. </font></p>  <pre>--&gt; 
 &lt;directory  path=&quot;/var/www/icons&quot;    url=&quot;http://www.example.com/images/&quot; /&gt;<br>&lt;directory<br>path=&quot;/var/www/docroot&quot;<br>url=&quot;http://www.example.com/&quot;<br>default_file=&quot;index.html&quot;<br>/&gt;</pre>  <table border="1" cellpadding="2" cellspacing="0" width="100%">  <tbody><tr>  <td width="19%" valign="top"><pre>path</pre></td>  <td valign="top" width="6%"><font size="-1">obligatoire</font></td>  <td width="75%" valign="top"><font size="-1">Indique le chemin initial. Le Générateur Sitemap parcourt ce répertoire et tous ses sous-répertoires</font>.</td>  </tr>   <tr>  <td valign="top"><pre>url</pre></td>  <td valign="top"><font size="-1">obligatoire</font></td>  <td valign="top"><font size="-1">Indique l'URL correspondant au chemin indiqué.</font></td>  </tr>  <tr>  <td valign="top"><pre>default_file</pre></td>  <td valign="top"><font size="-1">facultatif</font></td>  <td valign="top"><font size="-1">Désigne le fichier par défaut d'un répertoire sur le serveur.</font></td>  </tr>  </tbody></table>  </font>  <p><font size="-1"><b> accesslog<br></b>Balise facultative que vous pouvez utiliser pour indiquer le chemin d'accès et le nom des fichiers journaux IIS et Apache afin de permettre au Générateur Sitemap d'y sélectionner automatiquement les URL. </font></p>   <pre>&lt;accesslog path="/etc/httpd/logs/access-0.log" encoding="UTF-8"/&gt;</pre>  <table border="1" cellpadding="2" cellspacing="0" width="100%">  <tbody><tr>  <td width="19%" valign="top"><pre>path</pre></td>  <td valign="top" width="6%"><font size="-1">obligatoire</font></td>  <td width="75%" valign="top"><font size="-1">Indique le chemin du fichier.</font></td>  </tr>   <tr>  <td valign="top"><pre>encoding</pre></td>  <td valign="top"><font size="-1">facultatif</font></td>  <td valign="top"><font size="-1">Indique le codage du fichier (s'il est différent du système UTF-8).</font></td>  </tr>  </tbody></table>    <p><font size="-1"><b> sitemap<br></b>Balise facultative que vous pouvez utiliser pour indiquer le chemin d'accès et le nom des fichiers Sitemap créés à l'aide du Générateur Sitemap. Le Générateur Sitemap crée un fichier Sitemap unique comprenant les URL répertoriées dans chaque plan Sitemap. </font></p>   <pre>&lt;sitemap path=&quot;/var/www/docroot/subpath/sitemap.xml&quot; /&gt;</pre>  <table border="1" cellpadding="2" cellspacing="0" width="100%">  <tbody><tr>  <td width="19%" valign="top"><pre>path</pre></td>  <td valign="top" width="6%"><font size="-1">obligatoire</font></td>  <td width="75%" valign="top"><font size="-1">Indique le chemin du fichier Sitemap.</font></td>  </tr>  </tbody></table>    <p><font size="-1"><strong><a name="filter_examples"></a>filter<br></strong></font><font size="-1">Balise facultative que vous pouvez utiliser pour créer des règles qui incluent ou excluent certains fichiers. Les filtres sont appliqués dans leur ordre d'apparition dans le fichier config.xml. Toutefois, le fait d'intercaler les filtres et les entrées (url, urllist, directory ou accesslog) n'a aucune incidence ; chaque URL ajoutée au plan Sitemap par le Générateur Sitemap est d'abord étudiée par rapport à chacun des filtres définis. </font><font size="-1">Si aucun filtre ne correspond à une URL, cette dernière est incluse par défaut dans le plan Sitemap.</font></p>   <pre>&lt;filter action="drop" type="wildcard" pattern="*/internal/*" /&gt;</pre>  <table border="1" cellpadding="2" cellspacing="0" width="100%">  <tbody><tr>  <td width="19%" valign="top"><pre>action</pre></td>  <td valign="top" width="6%"><font size="-1">facultatif</font></td>  <td width="75%" valign="top">  <font size="-1"><p>Action à effectuer par le filtre. Les valeurs acceptées sont les suivantes :</p>  </font> <ul>  <li><font size="-1">drop - exclut les URL associées. Il s'agit de l'action effectuée par défaut. Si aucune action n'est précisée, le générateur considère qu'il s'agit d'une instruction &quot;drop&quot;.</font></li>  <li><font size="-1">pass - inclut les URL offrant une concordance.</font></li>  </ul>  </p></td>  </tr>   <tr>  <td width="19%" valign="top"><pre>type</pre></td>  <td valign="top" width="6%"><font size="-1">facultatif</font></td>  <td width="75%" valign="top"><font size="-1"><p>Type de filtrage. Les valeurs acceptées sont les suivantes :</p>  </font> <ul>  <li><font size="-1">wildcard - les caractères génériques normalement utilisés dans les chemins d'accès (? et *) permettent de distinguer les URL. Il s'agit du type utilisé par défaut. Si aucun type n'est précisé, le générateur considère qu'il s'agit d'un « wildcard ».</font></li>  <li><font size="-1">regexp - les expressions littérales sont utilisées.</font></li>  </ul></td>  </tr>  <tr>  <td valign="top"><pre>pattern</pre></td>  <td valign="top"><font size="-1">obligatoire</font></td>  <td valign="top"><font size="-1">Indique le format à respecter.</font></td>  </tr>  </tbody></table>  <font size="-1"> <p><b><a name="encoding"></a>Codage</b></p>   <p>Les fichiers référencés dans votre fichier de configuration, qu'il s'agisse de listes d'URL ou de fichiers journaux de serveur Web, peuvent utiliser un codage différent du système UTF-8 adopté par défaut. Vous pouvez spécifier un autre codage dans le fichier config.xml afin de déterminer le mode de lecture appliqué par le Générateur Sitemap pour vos fichiers. Les systèmes de codage les plus courants sont les suivants :</p>  <ul>  <li><strong>encoding="utf-8"</strong> est la valeur par défaut</li><li><strong>encoding="ascii"</strong> est un sous-ensemble du codage UTF-8. Vous n'avez donc pas à le préciser</li><li><strong>encoding="iso-8859-1"</strong> est commun à de nombreuses langues d'Europe de l'Ouest</li></ul>  </font>   <table border="0" cellpadding="2" cellspacing="0" width="100%">  <tbody><tr>  <td style="border-top: 1px solid rgb(221, 173, 8); background-color: rgb(254, 250, 222);"><a name="creating_mobile" id="creating_mobile"></a><b>2b. Informations supplémentaires sur la création d'un fichier de configuration pour appareils mobiles</b></td>  </tr>  </tbody></table>  <p><font size="-1">Qu'il concerne un plan Sitemap standard ou un plan Sitemap pour appareils mobiles, le fichier de configuration doit être créé de la même manière. Vous devez toutefois créer un fichier de configuration distinct pour chaque langage de marquage et exécuter le Générateur Sitemap séparément avec chacun d'eux afin d'obtenir autant de plans Sitemap que de langages utilisés.</font></p>  <p><font size="-1">Chaque fichier de configuration doit :</font></p>  <ul>  <li><font size="-1">Indiquez un nom de fichier distinct pour la valeur <a href="#create_config"><strong>store_into</strong> </a>.</font></li>  <li><font size="-1">Utilisez des <a href="#filter_examples">filtres</a> pour indiquer les URL à exclure et à inclure pour le langage de marquage. Notez que chaque plan Sitemap doit inclure des URL correspondant à un seul langage de marquage. Cela signifie que la même URL peut figurer dans plusieurs plans Sitemap, si elle est associée à plusieurs langages de marquage.</font></li>  </ul>  <p><strong><font size="-1">Exemples de filtrage</font></strong></p>  <p><font size="-1">Vous trouverez ci-dessous des exemples d'utilisation de filtres portant sur l'extension et permettant de générer des plans Sitemap pour appareils mobiles dans différents langages de marquage. Vous devez sélectionner le filtrage en fonction des types de langages de marquage utilisés sur votre site et de la manière dont vous indiquez chacun d'eux. Si vous avez structuré votre site selon différentes méthodes (en organisant dans des dossiers distincts, par exemple, vos URL utilisant des langages de marquage différents), vous devez définir le filtre en fonction des caractéristiques adoptées. Notez que les filtres sont appliqués dans l'ordre où ils apparaissent dans le fichier de configuration. Ainsi, le premier filtre doit être une instruction "pass" qui indique les URL à inclure dans le plan Sitemap. </font></p>  <p><font size="-1">Pour créer un plan Sitemap en langage WML (WAP 1.2) :</font></p>   <pre>&lt;filter action="pass" type="wildcard" pattern="*.wml" /&gt;
&lt;filter action="drop" type="wildcard" pattern="*.*" /&gt;<br>
</pre>   <p><font size="-1">Pour créer un plan Sitemap pour un profil mobile XHTML (WAP 2.0) :</font></p>   <pre>&lt;filter action="pass" type="wildcard" pattern="*.xhtml" /&gt;
&lt;filter action="drop" type="wildcard" pattern="*.*" /&gt;<br>
			</pre>  <table border="0" cellpadding="2" cellspacing="0" width="100%">  <tbody><tr>  <td style="border-top: 1px solid rgb(221, 173, 8); background-color: rgb(254, 250, 222);"><a name="copy"></a><b>3. Transfert de fichiers sur votre serveur Web</b></td>  </tr>  </tbody></table>  <p><font size="-1"> Vous devez transférer les fichiers ci-après sur votre serveur Web, à un emplacement accessible par la ligne de commande : </font></p>   <font size="-1"><ul>  <li><strong> config.xml</strong> – fichier de configuration que vous venez de créer à l'aide du modèle <strong>example_config.xml</strong>.</li>  <li><strong> sitemap_gen.py</strong> – script Python qui génère votre plan Sitemap.</li>  <li><strong> urllist.txt</strong> – ce fichier est facultatif&nbsp;; vous ne devez l'inclure que si vous avez appliqué la méthode de génération d'un plan Sitemap au moyen d'un fichier texte.</li>  </ul>   </font>  <p><font size="-1">La méthode de transfert de fichiers à appliquer dépend de votre environnement. Les protocoles couramment utilisés sont <a href="http://www.google.com/search?q=ftp">FTP</a> et SCP. Pour plus d'informations, contactez votre service d'hébergement Web. </font></p>   <table border="0" cellpadding="2" cellspacing="0" width="100%">  <tbody><tr>  <td style="border-top: 1px solid rgb(221, 173, 8); background-color: rgb(254, 250, 222);"><a name="execute"></a><strong>4. Exécution du script du Générateur Sitemap (sitemap_gen.py) </strong></td>  </tr>  </tbody></table>   <p><font size="-1"> Pour exécuter le Générateur Sitemap, vous devez vous connecter à votre serveur Web. La méthode de connexion à appliquer dépend de votre environnement. Par exemple, le protocole <a href="http://www.google.com/search?q=ssh">SSH</a> est généralement utilisé pour accéder à un serveur UNIX. Pour plus d'informations sur la connexion à votre serveur Web et l'exécution de scripts, adressez-vous à votre service d'hébergement Web. </font></p>   <p><font size="-1"> Une fois les fichiers copiés sur votre serveur Web, vous devez exécuter le script du Générateur Sitemap. Connectez-vous à votre serveur Web et exécutez la commande ci-après (remplacez <strong>&lt;path/config.xml&gt;</strong> par le chemin d'accès et le nom de votre fichier de configuration. Si vous avez transféré ce fichier au même emplacement que le script Python, vous pouvez omettre le chemin) :</font></p>   <pre>python sitemap_gen.py --config=&lt;path/config.xml&gt</pre> <p><font size="-1">Ainsi, une ligne de commande UNIX pourrait se présenter de la façon suivante :</font></p> <p><img src="images/python_command.gif" alt="Commande Python"></p> <p><font size="-1">Une ligne de commande MS-DOS pourrait se présenter de la façon suivante :</font></p> <p><img src="images/python_dos.gif" alt="Commande Python"></p> <p><font size="-1"><b>Conseil :</b> Si vous testez votre configuration, mais ne souhaitez pas envoyer votre plan Sitemap tout de suite, utilisez la syntaxe suivante pour empêcher le Générateur Sitemap de contacter Google :</font></p>  <pre><br>$ python sitemap_gen.py --config=config.xml -- test</pre>  <font size="-1"><p>Le statut de votre requête apparaît dans l'invite de commande :</p></font> <pre>Reading configuration file: /path/config.xml
	Opened URLLIST "/path/urllist.txt"
	Walking DIRECTORY "/var/www/html/dir"
	Walking DIRECTORY "/var/www/html/dir2"
	Opened ACCESSLOG "/etc/httpd/logs/access-0.log"
	Sorting and normalizing collected URLs.
	Writing Sitemap file "/path/sitemap.xml.gz" with 1092 URLs
	Notifying search engines.
	Notifying www.google.com
	Count of file extensions on URLs:
		208  .html
		574  .jpg
		...
		Number of errors: 0
		Number of warnings: 0</pre>  <font size="-1">  <p>Si peu de pages ont cette apparence, souvenez-vous que le paramètre verbose de votre fichier de configuration détermine la quantité d'informations affichées à l'écran. Cet exemple correspond à un paramètre verbose ayant la valeur « 1 ».</p>  <p>Toute erreur du fichier sera également renvoyée. Par exemple, si vous laissez l'attribut url= en-dehors d'une entrée de répertoire, le script produira le résultat suivant :</p></font> <pre>[ERROR] Directory entries must have both "path" and "url" attributes
	Number of errors: 1</pre>  <font size="-1">  </font>  <p><font size="-1">Corrigez toutes les erreurs de votre fichier <b>config.xml</b> et réexécutez le script. Si le fichier ne contient aucune erreur, le Générateur Sitemap crée un fichier <b>sitemap.xml.gz</b> à l'emplacement que vous avez indiqué dans le fichier de configuration. </font></p>  <table border="0" cellpadding="2" cellspacing="0" width="100%">  <tbody><tr>  <td style="border-top: 1px solid rgb(221, 173, 8); background-color: rgb(254, 250, 222);"><a name="submitting" id="submitting"></a><strong>5. Envoi de votre plan Sitemap à Google </strong></td>  </tr>  </tbody></table>  <p><font size="-1">Le Générateur Sitemap crée un fichier <strong>sitemap.xml.gz</strong> à l'emplacement que vous avez indiqué dans le fichier de configuration. Une fois ce fichier créé, vérifiez qu'il est accessible par l'intermédiaire d'un navigateur Web. Ensuite, <a href="http://www.google.com/support/webmasters/bin/answer.py?answer=34575&topic=8496">ajoutez-le</a> à votre compte <a href="https://www.google.com/webmasters/sitemaps/siteoverview">Google Sitemaps</a>. Cela permettra à Google de vous fournir des informations utiles (état et statistiques). Si Google signale des problèmes avec votre plan Sitemap, vous pourrez les corriger et renvoyer le plan. Vous ne devez ajouter le plan Sitemap manuellement qu'une seule fois. Après cela, vous pouvez utiliser une <a href="submit.html#ping">requête HTTP</a> pour informer Google des modifications apportées à votre plan Sitemap (bien que vous puissiez également renvoyer ce plan par l'intermédiaire de votre compte Google Outils pour les webmasters). </font></p>   <table border="0" cellpadding="2" cellspacing="0" width="100%">  <tbody><tr>  <td style="border-top: 1px solid rgb(221, 173, 8); background-color: rgb(254, 250, 222);"><a name="recur"></a><b>6. Configuration d'un script répétitif</b></td>  </tr>  </tbody></table>  <font size="-1">  <p>Nous vous suggérons de configurer le Générateur Sitemap afin qu'il s'exécute à chaque modification du contenu, sans dépasser une exécution par heure.</p>  </font>  <p><font size="-1">Les administrateurs Web travaillant avec un serveur Web UNIX peuvent éventuellement configurer ceci comme une <a href="http://www.google.com/search?q=cron">tâche CRON</a>. </font></p>  <font size="-1"><p>Les administrateurs Web utilisant d'autres plates-formes doivent contacter l'administrateur système pour obtenir de l'aide sur la configuration des scripts répétitifs. Les commentaires d'autres utilisateurs du groupe Google Sitemaps sur le service <a href="http://www.google.com/webmasters/sitemaps/googlegroup?hl=fr">Groupes Google</a> peuvent également se révéler utiles.</p>   </font>  <p><font size="-1"> Vous pouvez utiliser une <a href="submit.html#ping">requête HTTP</a> pour informer Google des modifications apportées à votre plan Sitemap. Assurez-vous toutefois de vous être connecté une fois aux <a href="https://www.google.com/webmasters/sitemaps/siteoverview">outils Google pour les webmasters</a> à l'aide de votre compte Google avant d'<a href="http://www.google.com/support/webmasters/bin/answer.py?answer=34575&topic=8496">ajouter votre plan Sitemap</a> manuellement au compte d'outils pour les webmasters.</font></p>  <font size="-1"></font>  <table border="0" cellpadding="2" cellspacing="0" width="100%">  <tbody><tr>  <td style="border-top: 1px solid rgb(221, 173, 8); background-color: rgb(254, 250, 222);"><a name="troubleshoot"></a><b>Résolution des problèmes</b></td>  </tr>  </tbody></table>  <font size="-1">  <p>Dans cette section, nous aborderons quelques questions ou problèmes courants rencontrés lors de l'utilisation du Générateur Sitemap ainsi que les solutions envisageables.</p>  <p><b>Accessible par le Web</b></p>  <p><b>Problème :</b> Le Générateur Sitemap renvoie l'erreur et l'avertissement suivants :</p>  </font> <pre>[ERROR] When attempting to access your generated Sitemap at the following URL:
	http://www.example.com/sitemap.xml.gz
	we failed to read it.  Please verify the store_into path you specified in
	your configuration file is web-accessible.  Consult the FAQ for more
	information.
	[WARNING] Proceeding to notify with an unverifiable URL.</pre>  <font size="-1">  <p><b>Que s'est-il passé ?</b> Le Générateur Sitemap a créé le fichier à l'emplacement indiqué puis a tenté, sans succès, de l'extraire à l'aide du protocole HTTP ainsi que le ferait un moteur de recherche. Le Générateur a poursuivi la procédure et notifié la présence du fichier aux moteurs de recherche, tout en vous signalant l'erreur et en vous avertissant que votre plan Sitemap ne sera peut-être pas lisible par les moteurs.</p>  <p>Le Générateur Sitemap crée votre fichier Sitemap à l'emplacement indiqué par l'attribut store_into du fichier <b>config.xml</b>. Le Générateur Sitemap définit ensuite à partir de l'attribut base_url une URL menant à ce fichier et communique celle-ci aux moteurs de recherche. Par exemple, si votre configuration est la suivante :</p>  </font> <pre>&lt;site base_url="http://www.example.com/"
	      store_into="/var/www/html/sitemap.xml.gz"&gt;</pre>  <font size="-1">  </font><p><font size="-1">Le Générateur Sitemap indique aux moteurs de recherche d'explorer votre plan Sitemap à l'adresse :</font></p>   <pre>http://www.example.com/sitemap.xml.gz</pre>  <font size="-1"><p>Le fichier doit être accessible par l'intermédiaire de cette URL. Si le fichier ne peut pas être extrait à l'aide de cette URL, les moteurs de recherche n'ont aucun moyen de localiser votre plan Sitemap.</p>  </font><p><font size="-1"><b>Que pouvez-vous faire ?</b> Vous devez vérifier que votre fichier <b>config.xml</b> indique les chemins base_url et store_into de votre plan Sitemap. Vous devez également vérifier que les navigateurs Web peuvent extraire le fichier Sitemap à l'emplacement base_url. Si vous décelez des erreurs dans le chemin d'accès ou dans l'URL, vous devrez peut-être réexécuter le Générateur Sitemap, ou simplement déplacer le fichier Sitemap vers l'emplacement correct et le signaler manuellement aux moteurs de recherche par l'intermédiaire de leurs sites Web.  </font></p>  <font size="-1"><p><b>Prise en charge du format XML</b></p>  <p><strong>Problème :</strong> Le Générateur Sitemap renvoie l'erreur suivante :</p>  </font> <pre>Some installs of Python 2.2 do not include complete support for XML. 
	Please try upgrading your version of Python and re-running the script.</pre>  <font size="-1"><p><b>Que s'est-il passé ?</b> Comme l'indique le message, certaines plates-formes utilisent une version de Python (le langage dans lequel le script du Générateur Sitemap est rédigé) d'où sont absentes les bibliothèques nécessaires pour le traitement des fichiers XML. L'exécution de ce script requiert une prise en charge XML totale.</p>  <p><b>Que pouvez-vous faire ?</b> Essayez de mettre à niveau votre version de Python. Pour ce faire, vous devrez probablement demander l'aide de votre administrateur système.</p>  <p>Notez que seul le Générateur Sitemap est concerné, et non les plans Sitemap en général. Si vous connaissez une méthode ou un outil de création de plans Sitemap différent, vous pouvez l'utiliser pour envoyer vos plans Sitemap aux moteurs de recherche.</p>  <p><b>Que sont les fichiers supplémentaires contenus dans l'archive .gz ou .zip ?</b></p>  <p>Lors de l'extraction du script sitemap_gen.py, vous découvrirez probablement des fichiers supplémentaires non mentionnés ci-dessus. La liste complète des fichiers doit se présenter comme suit :</p>  </font>  <pre>AUTHORS
	ChangeLog
	COPYING
	example_config.xml
	example_urllist.txt
	PKG-INFO
	README
	setup.py
	sitemap_gen.py
	test_sitemap_gen.py</pre>  <font size="-1"><p>Les fichiers supplémentaires contiennent généralement des informations sur le produit et les conditions de la licence d'utilisation. Nous vous invitons à les consulter.</p>  <p>Le fichier test_sitemap_gen.py fait figure d'exception. Il s'agit d'un script de test d'unité que d'autres développeurs peuvent utiliser s'ils souhaitent participer à ce projet ouvert. Si vous avez l'intention d'utiliser le Générateur Sitemap sans apporter aucune modification au code source (ce qui est le cas de pratiquement tous les utilisateurs), vous n'aurez vraisemblablement pas besoin de ce script de test.</p>Si ce projet vous intéresse et si souhaitez y participer, nous vous invitons à visiter le site <a href="http://sourceforge.net/projects/goog-sitemapgen">http://sourceforge.net/projects/goog-sitemapgen</a>. Pour obtenir des liens vers des programmes tiers compatibles avec Google Sitemaps, <a href="http://code.google.com/sm_thirdparty.html">cliquez sur ce lien</a>.</p>   <font size="-1"></font></font>  <p><font size="-1"><b><a name="nonascii"></a>Caractères non ASCII </b></font></p>  <font size="-1"><font size="-1">  </font></font>  <p><font size="-1"><strong>Problème :</strong> Le nom de domaine de votre site ou les URL qu'il contient comportent des caractères non ASCII.</font></p>  <p><font size="-1">De façon générale, les URL non ASCII doivent être <a href="protocol.html#escaped">enregistrées avec un codage UTF-8</a> avant d'être associées aux caractères d'échappement %. Toutefois, certains serveurs Web ne répondent correctement que si les URL sont enregistrées avec un autre codage qu'UTF-8. Toutes les URL figurant dans votre plan Sitemap, ainsi que celles du plan Sitemap proprement dit, doivent être codées de façon à pouvoir être lues par le serveur Web sur lequel elles se trouvent. Dans la section relative à la définition du <a href="#sitetag">site</a>, utilisez l'attribut <strong>default_encoding</strong> facultatif pour indiquer le format de codage adopté par votre serveur Web. Si vous n'utilisez pas cette balise et si votre serveur Web fait appel à un codage différent du système UTF-8, nous ne saurons pas quel codage employer.</font></p>  <p><font size="-1">Si vos URL contiennent des caractères non ASCII, nous vous recommandons d'exécuter le script du Générateur Sitemap avec la version 2.3 ou ultérieure de Python. La prise en charge des caractères non ASCII a en effet été étendue dans cette version de Python et les suivantes. Si votre nom de domaine comporte des caractères non ASCII, vous devez utiliser Python version 2.3 ou ultérieure, car la prise en charge Internationalizing Domain Names in Applications (IDNA) n'était pas assurée dans les versions antérieures du logiciel. Sans cette prise en charge IDNA, le Générateur Sitemap ne parvient pas à coder correctement les noms de domaines non ASCII. </font></p>  <font size="-1">     <br>  <p class="d" align="right"><i>Date de dernière modification : 15 avril 2006</i></p>  </font></div>  </td>  </tr>  <tr>  <td width="1%" valign="top"><img src="http://www.google.com/images/art.gif" width="143" height="53" vspace="5" hspace="15"></td>  <td style="background-color: #ffffff" width="1" valign="top"><img src="http://www.google.com/images/cleardot.gif" width="1" height="1"></td>  <td style="background-color: #ffffff" width="10" valign="top"><img src="http://www.google.com/images/cleardot.gif" width="1" height="1"></td>  <td valign="middle"><div class="footer">  <div align="center"><font size="-1"> &copy;2007 Google - <a href="http://www.google.com/privacy.html">Règles de confidentialité</a> - <a href="http://www.google.com/accounts/TOS">Conditions générales</a> - <a href="http://www.google.com/about.html">À propos de Google</a> </font></div>  </div></td>  </tr> </table> </body> </html>  